معركة تحديثات الذكاء الاصطناعي لمشاريع جوجل أسترا، فيو، وجمني: تقدمات جديدة
هذه هي استجابة جوجل لـ OpenAI.
الذكاء الاصطناعي العام، ذكاء اصطناعي يمكن استخدامه يومياً، سيكون من المحرج عقد مؤتمر صحفي إذا لم يكن الأمر كذلك الآن.
في صباح يوم 15 مايو، بدأت فعالية مؤتمر مطوري جوجل I/O السنوي "مهرجان الربيع لعالم التكنولوجيا" رسمياً. كم مرة تم ذكر الذكاء الاصطناعي في خطاب الرئيس الرئيسي الذي دام 110 دقائق؟ لقد قامت جوجل بحسابها:
نعم، يتم الحديث عن الذكاء الاصطناعي في كل دقيقة.
لقد وصلت المنافسة في الذكاء الاصطناعي التوليدي حديثاً إلى ذروتها جديدة، ومحتوى مؤتمر I/O هذا يدور بشكل طبيعي حول الذكاء الاصطناعي.
"قبل عام على هذه المنصة، شاركنا أولاً خططنا للنموذج الكبير متعدد الوسائط الأصلي، جمني. لقد كان ذلك بمثابة الجيل الجديد من I/O،" قال الرئيس التنفيذي لجوجل سوندار بيتشاي. "اليوم، نأمل أن يتمكن الجميع من الاستفادة من تكنولوجيا جمني. هذه الميزات الرائدة ستتغلغل في البحث، والصور، وأدوات الإنتاجية، وأنظمة أندرويد، والعديد من الجوانب الأخرى."
حالياً، يتوفر كل من 1.5 برو و1.5 فلاش للمراجعة العامة ويقدمان نافذة سياق مكونة من 1 مليون توكن في استوديو جوجل AI وVertex AI. الآن، يوفر 1.5 برو أيضاً نافذة سياق مكونة من 2 مليون توكن للمطورين الذين يستخدمون API وعملاء جوجل كلاود عبر قائمة الانتظار.
بالإضافة إلى ذلك، تم توسيع جمني نانو من إدخال النص الخالص إلى إدخال الصور. في وقت لاحق من هذا العام، بدءاً من بيكسل، ستطلق جوجل جمني نانو متعدد الوسائط. وهذا يعني أن مستخدمي الهواتف المحمولة يمكنهم معالجة إدخال النص فحسب، بل يفهمون أيضاً المزيد من المعلومات السياقية، مثل المرئيات، والصوت، واللغة المنطوقة.
تستقبل عائلة جمني عضواً جديداً: جمني 1.5 فلاش
تم تحسين 1.5 فلاش الجديد للسرعة والكفاءة.
الجيل الجديد من النموذج الكبير مفتوح المصدر جيمّا 2
اليوم، أصدرت جوجل أيضاً سلسلة من التحديثات للنموذج الكبير المفتوح المصدر جيمّا - جيمّا 2 هنا.
كما تم تقديمه، يستخدم جيمّا 2 بنية جديدة تهدف إلى تحقيق أداء وكفاءة رائدين، والمعلمات الجديدة للنموذج المفتوح المصدر هي 27B.
عندما يتعلق الأمر بالفيديوهات الطويلة، يمكن لفيو إنتاج فيديوهات تصل إلى 60 ثانية أو أكثر. يمكنه القيام بذلك من خلال موجه واحد أو من خلال توفير سلسلة من الموجهات التي تحكي قصة معاً. هذا أمر أساسي لتطبيق نماذج إنتاج الفيديو في صناعة السينما والتلفزيون.
فيو يعتمد على عمل جوجل في توليد المحتوى المرئي، بما في ذلك شبكة الاستعلام التوليدية (GQN)، DVD-GAN، تحويل الصورة إلى فيديو، فينكي، WALT، فيديوشاعر، لوميير، وغيرها.